Perspectiva del aprendizaje

B.F Skinner y el condicionamiento operante

Los conductistas se concentran en la modificación de la conducta a través del uso de técnicas de condicionamiento y contra-condicionamiento.

add
B@UNAM
CUAIEED

B.F Skinner y el condicionamiento operante

B.F Skinner y el condicionamiento operante

Mediante el condicionamiento operante el sujeto aprende la asociación que se da entre su conducta y las consecuencias de ésta. El sujeto primero actúa, y entonces el medio ambiente responde con una consecuencia a dicha acción. Esta es la principal diferencia con el condicionamiento clásico, en el cual un estímulo del medio ambiente desencadena una respuesta automática y refleja en el sujeto.

De acuerdo con los principios del condicionamiento operante, la conducta aumenta su probabilidad de ser repetida si ésta es seguida por una recompensa, o por algo que represente un incentivo para volver a llevarla a cabo. Y al contrario, las conductas que son menos probables de repetirse son aquellas que no obtienen nada a cambio o que son seguidas por algo desagradable o displacentero.

El condicionamiento operante es definitorio de los trabajos experimentales de B. F. Skinner, quien aprovechó y amplió la ley del efecto planteada por E. L. Thorndike, que señalaba que una conducta que era recompensada aumentaba su probabilidad de repetirse. En ese sentido el condicionamiento operante es un tipo de aprendizaje en el que el sujeto “aprende” a emitir conductas que son seguidas de una consecuencia agradable también “aprende” a no emitir conductas cuyas consecuencias sean desagradables.

Skinner diseñó para llevar a cabo sus experimentos con ratas y pichones un tipo de jaula denominada caja de Skinner, una jaula que incluye una palanca que una rata puede presionar, o un disco que un pichón puede picotear, para obtener una pequeña cantidad de alimento, también incluye luces internas y un aparato de medición del número de veces que se manipula la palanca o se picotea el disco.

Sus experimentos consistían en enseñar a sus animales a que ejecutaran cierta conducta para obtener una recompensa (alimento). Típicamente una rata aprendía a presionar una palanca y una paloma a picotear un pequeño disco para obtener alimento. Este tipo de conductas, a diferencia de lo que sucede en el condicionamiento clásico, no son reflejas.

Para lograr que el animal ejecutara la conducta que se deseaba, como presionar la palanca de la caja, Skinner ideó un procedimiento llamado moldeamiento, el cual consiste en recompensar conductas que poco a poco se vayan acercando a la ejecución deseada.

Las conductas que se van acercando a la ejecución final son recompensadas diferencialmente mediante aproximaciones sucesivas, lo cual es equivalente al proceso de adquisición.

La recompensa utilizada en el condicionamiento operante recibe el nombre de reforzamiento. Sin embargo, no todos los reforzamientos son recompensas directas. Los reforzadores primarios - un estímulo reforzante natural-, son satisfactores naturales como la comida. Por otro lado los reforzadores secundarios no son satisfactores naturales; los sujetos tienen que aprender el valor de un reforzador secundario - reforzamiento condicionado que obtiene su poder mediante su asociación con un reforzador primario-.

El reforzamiento positivo le proporciona algo al sujeto que hace más probable que una conducta se vuelva a repetir.

Existe también el reforzamiento negativo, el cual no es lo que generalmente pensamos que es una recompensa, pero éste, al igual que el positivo, también hace que el sujeto quiera repetir una conducta. El reforzamiento negativo “refuerza” una conducta que permite evitar o escapar de una situación desagradable o aversiva.

El castigo es algo que desalienta al sujeto a repetir una conducta. El castigo es un evento desagradable que decrementa la probabilidad de que una conducta vuelva a ocurrir. Sin embargo, el uso del castigo no es muy recomendable. Las conductas castigadas pueden ser temporalmente suprimidas, pero no necesariamente totalmente extinguidas.

Agregaremos algunas otras cosas que aprender acerca del reforzamiento. El reforzamiento puede variar en cuanto a la forma de ser administrado; se puede dar cada vez que la conducta ocurre (reforzamiento continuo) o sólo algunas veces, después de que la conducta ocurre (reforzamiento intermitente).

El reforzamiento intermitente hace que el proceso de adquisición sea más largo, debido a que al sujeto le tomará más tiempo aprender la asociación. También incrementa el periodo de extinción, ya que el sujeto mantendrá la expectativa de que la siguiente conducta será reforzada.

Existen cuatro programas de reforzamiento intermitente:

  1. Razón fija, cuando el reforzamiento ocurre después de un número específico de respuestas, como el pago por obra determinada.
  2. Razón variable, el reforzamiento ocurre después de un número impredecible de respuestas, como las máquinas tragamonedas de juegos de azar.
  3. Intervalo fijo, se refuerza la primera respuesta que ocurre después de un periodo de tiempo específico, lo que resulta en que la tasa de respuestas se va incrementando conforme se acerca el momento del reforzamiento. Como aquel niño que se va portando bien, conforme se va acercando el día de su cumpleaños.
  4. Intervalo variable, cuando el reforzamiento aparece por intervalos de tiempo no predecibles. Esto es lo que hace que un estudiante haga sus tareas todos los días, aunque no sepa si el profesor la va a revisar ese día.

Los principios del condicionamiento clásico y operante son aplicados en un tipo de psicoterapia denominada terapia conductual, generalmente con el fin de eliminar conductas indeseables y de incrementar aquellas conductas que se consideran como positivas. Los conductistas no creen que el buscar los determinantes del inconsciente o ser más conscientes sea la clave para cambiar la conducta. Los conductistas se concentran en la modificación de la conducta a través del uso de técnicas de condicionamiento y contra-condicionamiento.

Dos técnicas terapéuticas de contra-condicionamiento son la desensibilización sistemática y el condicionamiento aversivo.

La desensibilización sistemática es frecuentemente usada en el tratamiento de temores irracionales (fobias) y control del estrés, consiste en asociar un estado de relajación con la situación que provoca ansiedad. La idea es que no se puede estar ansioso y relajado al mismo tiempo. Si una persona utiliza una técnica de relajación (respiración profunda y pausada, relajamiento muscular, elaboración de imágenes tranquilizadoras) mientras esta ante la presencia del estímulo que le produce ansiedad, la ansiedad será eliminada.

Condicionamiento aversivo

El condicionamiento aversivo es un procedimiento en el que se asocia una situación desagradable con una conducta indeseable. Esto significa que cada vez que se hace algo que se supone que no se debe hacer, algo realmente desagradable sucederá. Un ejemplo podría ser cuando en un fumador se producen nauseas cada vez que prende un cigarro.

La economía de fichas es un programa de condicionamiento operante que incluye el reforzamiento de conductas deseadas y el cobro de reforzamientos previamente ganados, por emitir conductas indeseables. Los sujetos obtienen fichas cuando emiten conductas deseadas o no emiten conductas indeseables. Posteriormente las fichas pueden ser cambiadas por privilegios o regalos. Este tipo de modificación conductual funciona muy bien con niños o con sujetos en una situación restrictiva, como un reclusorio o un hospital psiquiátrico; sin embargo, los cambios a largo plazo son raros, ya que tan pronto como el sistema de reforzamiento es retirado, el comportamiento no deseado reaparece.

Autoevaluación

Identifica en cada imagen el condicionamiento operante con su conducta y el reforzamiento mostrado.

Conducta

Conducta 1
Reforzamiento positivo 1
Conducta 2
Reforzamiento negativo 2

Reforzamiento

El niño no hace la tarea.

Solo los niños que llevan tarea son premiados.

El niño hace su tarea.

Los niños que no hacen tarea pierden su recreo.